home *** CD-ROM | disk | FTP | other *** search
/ Network Support Library / RoseWare - Network Support Library.iso / bantech / tn2223.asc < prev    next >
Text File  |  1991-08-15  |  13KB  |  322 lines

  1. TechNotes
  2. -----------------------------------------------------------------
  3. Bulletin Number:   222-3
  4.  
  5. Date:              13 August 1991
  6.  
  7. Summary:           Fix for 4.10 file system inconsistency problem
  8.  
  9. Server:            All
  10.  
  11. Software Version:  4.10 (0) and 4.10 (1)
  12.  
  13. Category:          VINES
  14. -----------------------------------------------------------------
  15.  
  16.  
  17. PROBLEM:
  18.  
  19. A problem has been identified in VINES Revision 4.10 that in certain cases
  20. can cause inconsistencies in the file system.  The problem is unique to
  21. VINES 4.10 (0) and is related to a specific set of file system operations and
  22. environments.
  23.  
  24. The problem occurs when the end of a file that is larger than 266KB is
  25. truncated and the file is reduced to a size that is equal to or less than
  26. 266KB.  When the reduced file is written to disk, there is a small possibility
  27. that the data blocks that are no longer needed are not released properly.
  28. The problem occurs only if these data blocks are reallocated before the
  29. original file is deleted.  If the data blocks are released properly, then no
  30. inconsistencies occur in the file system.
  31.  
  32. This problem may occur on any server running VINES 4.10 (0), including servers
  33. that have applied the 4.10 (1) Applications Toolkit patch.  This problem does
  34. not occur on servers running VINES 3.x or 4.00, for example 4.00 (5).
  35.  
  36.     Note:  The 222-3 version of this technical bulletin obsoletes any
  37.            previous version.
  38.  
  39.  
  40.  
  41. SYMPTOMS:
  42.  
  43. Your server may have experienced this file system inconsistency problem if the
  44. server is running VINES 4.10 (0) or 4.10 (1) and you see any of the following
  45. messages or symptoms:
  46.  
  47.     ■ For non-Banyan, PC-based servers, the following message is displayed
  48.       on the server console screen or in the Server Operating System log file:
  49.  
  50.           Bad block on hard disk device n, drive n
  51.  
  52.       For Banyan/CNS and Banyan/CNS486 servers, one of the following messages
  53.       is displayed on the server console screen or in the Server Operating
  54.       System log file:
  55.  
  56.           Bad block on System Disk
  57.  
  58.           Bad block on /diskn
  59.  
  60.       In the second message, "n" designates the affected disk, for example,
  61.       disk2.
  62.  
  63.     ■ Messages in the following formats appear in the File System Log section
  64.       of your server System Log file.
  65.  
  66.           BAD BLKS I=nnnn
  67.  
  68.           nnnnnn DUP I=nnnn
  69.  
  70.           DUP/BAD I=nnnn
  71.  
  72.       In these messages, the number of digits (n) varies from 1 to 10, as in
  73.       this example:
  74.  
  75.           26077 DUP I=1543
  76.  
  77.           DUP/BAD I=1668
  78.  
  79.     ■ You have data files that appear to be in an inconsistent state.
  80.  
  81.     ■ During a reboot, the server experiences an unusually long delay after
  82.       displaying the "Checking Disks" message.  In this case, generate a log
  83.       file and examine it for the messages listed above.
  84.  
  85. Note that in all cases, examining your Server Operating System and System Log
  86. files is highly recommended.
  87.  
  88.  
  89.  
  90. PREVENTATIVE MEASURES:
  91.  
  92. A site-specific patch (described below) is available to fix the problem.  If
  93. you have not obtained this patch and you are unsure whether your VINES 4.10 (0)
  94. server has experienced this problem, you should take the following preventative
  95. measures:
  96.  
  97.     ■ Do not overwrite any current system backups.  If a data file on your
  98.       disk is inconsistent, you may be able to recover it from one of your
  99.       existing backups.  In particular, do not overwrite any backup taken when
  100.       your server was running VINES 4.00, because your 4.10 backups may already
  101.       contain inconsistent data.
  102.  
  103.     ■ Downgrading your server to VINES 4.00 is a preventative measure.
  104.  
  105. If you are not running VINES 4.10 (0) but plan to do so in the future, you
  106.  should wait until you have the patch before upgrading or installing VINES
  107. 4.10 (0).  It is imperative that you apply the patch with 4.10 (0).
  108.  
  109.  
  110.  
  111. SOLUTION:
  112.  
  113. A site-specific patch is available that fixes the problem for 4.10 servers.
  114. The patch is shipped in two versions, named 4.10-CF-3 and 4.10-CG-3:
  115.  
  116.     ■ Use patch 4.10-CG-3 if you have patched your server with any of the
  117.       following patches: 4.10-AC-1, 4.10-AN-1, 4.10-AP-1, 4.10-BD-1,
  118.       4.10-BP-1, or 4.10-CB-1.  Note that 4.10-CG-3 obsoletes these patches.
  119.  
  120.     ■ Use patch 4.10-CF-3 in all other cases.  You can use this patch with
  121.       any other 4.10 patch, except for the patches listed above.
  122.  
  123. The problem fix will be incorporated in the VINES 4.10 (5) maintenance release.
  124. When 4.10 (5) is available, use it instead of the 4.10-CF-3 or 4.10-CG-3 patch.
  125.  
  126. Note that the 4.10-CF-3 and 4.10-CG-3 patches are identical to the 4.10-CF-1
  127. and 4.10-CG-1 patches, except that the -3 versions fix the CNS double-boot
  128. problem, provide a more robust fsck (file system check) program, and display
  129. shorter fsck messages for readability's sake.  Note also that the -3 fsck
  130. messages described in this bulletin are slightly different from previous fsck
  131. messages that appeared in base 4.10 (0) logs or that are documented elsewhere.
  132.  
  133. If you applied either the 4.10-CF-1 or 4.10-CG-1 patch, you do not have to
  134. apply the -3 version.  (The -2 version was an interim version that was not
  135. released.)
  136.  
  137.  
  138.  
  139. APPLYING THE PATCH:
  140.  
  141. The patch fix prevents future occurrences of the file system inconsistency
  142. problem, but it does not recover from a previous occurrence of this problem.
  143. Therefore, if your server has experienced this problem, use the following
  144. recovery procedure to return the file system to a consistent state:
  145.  
  146.  
  147.     1. Manually copy any mission-critical file to a PC hard disk.  Some files
  148.        may be only partially inconsistent and you may be able to recover a
  149.        portion of an affected file from the hard disk.  The reason for copying
  150.        these important files is that if any of them are inconsistent, they will
  151.        be deleted from the system during the recovery process.
  152.  
  153.     2. Shut down the server software from the server console and pick the
  154.        option, RETURN to Operator Menu.
  155.  
  156.     3. Perform a full system backup and verify its readability.  Do not
  157.        overwrite any previous backups you may have.
  158.  
  159.        Be aware that the backup procedure may fail if it encounters
  160.        inconsistent files.  In this case, continue with the procedure. 
  161.        The inconsistent files will be deleted and will need to be restored
  162.        from copies on your PC (see step 1) or from a previous backup.
  163.  
  164.     4. Restart services so that you can log in to patch the server.
  165.  
  166.     5. Apply the 4.10-CF-3 or 4.10-CG-3 patch to your server.  Both versions
  167.        of the patch will reboot the server.
  168.  
  169.     6. Generate a System Log file (from a PC) or a Server Operating System
  170.        log file (from the server console).  Be sure to save a copy of the log
  171.        file.  See the following section for instructions on how to interpret
  172.        the messages in the log file.
  173.  
  174. The patch reboot forces the system to search the disks for inconsistent files.
  175. Any files with inconsistencies that are found are deleted.  To determine which
  176. files have been deleted, examine the File System Log section of the log file.
  177.  
  178. If VINES internal files (such as the files for the SS or ST services) are
  179. inconsistent or are deleted by the recovery procedure, the system will not
  180. operate correctly.  For example, you may not be able to restart services at
  181. step 4 or the reboot procedure at step 5 may not finish properly.  In this
  182. case, you must replace the VINES internal files by performing a 4.10 upgrade
  183. procedure.  Be sure to reapply the 4.10-CF-3 or 4.10-CG-3 patch.  See the
  184. "VINES 4.10 Release Notice" for details on the upgrade procedure.
  185.  
  186.  
  187.  
  188. INTERPRETING THE FILE SYSTEM LOG SECTION:
  189.  
  190. At the end of the System Log file is the File System Log section.  In this
  191. section is a series of entries under the heading "fsck log."  (When
  192. generated from the server console, the log is called the Server Operating
  193. System log and the final section is the File System Checker Log.  There is
  194. no "fsck log" heading.)
  195.  
  196. The following example illustrates a System Log file with these entries:
  197.  
  198.  
  199.  
  200.     =============================================================
  201.            File System Log 
  202.     =============================================================
  203.  
  204.            ===== fsck log  ====
  205.  
  206.       /dev/radusr
  207.       File System: disk1 Volume: 
  208.  
  209.       ** Phase 1 - Check Blocks and Sizes
  210.       25111 DUP I=1541
  211.     BAD BLKS I=1541
  212.     BAD BLKS I=1543
  213.       24870 DUP I=1545
  214.     BAD BLKS I=1545
  215.       26077 DUP I=1668
  216.       ** Phase 1b - Rescan For More DUPS
  217.       25111 DUP I=1492
  218.       24870 DUP I=1492
  219.       26077 DUP I=1543
  220.  
  221.       ** Phase 2 - Check Pathnames
  222.       DUP/BAD  I=1492
  223.       FILE=/banyan/st/st
  224.       REMOVE?  yes
  225.  
  226.       DUP/BAD  I=1541
  227.       FILE=/BFS/fs1/TEST.1/ABC
  228.       REMOVE?  yes
  229.  
  230.       DUP/BAD  I=1543
  231.       FILE=/BFS/fs1/TEST.2/DEF
  232.       REMOVE?  yes
  233.  
  234.       DUP/BAD  I=1668
  235.       FILE=/BFS/fs1/TEST.3/GHI
  236.       REMOVE?  yes
  237.  
  238.       DUP/BAD  I=1545
  239.       FILE=/BFS/fs1/TEST.4/JKL
  240.       REMOVE?  yes
  241.  
  242.       ** Phase 3 - Check Connectivity
  243.       ** Phase 4 - Check Reference Counts
  244.       UNREF FILE  I=1412  (EMPTY) Cleared
  245.       UNREF FILE  I=1417  (EMPTY) Cleared
  246.       UNREF FILE  I=1418  (EMPTY) Cleared
  247.       UNREF FILE  I=1420  (EMPTY) Cleared
  248.       BAD/DUP FILE I=1492  (NOT EMPTY)
  249.  
  250.       CLEAR?  yes
  251.  
  252.       FREE INODE COUNT WRONG IN SUPERBLK
  253.       FIXED
  254.       ** Phase 5 - Building Bit Map   11204 files 139086 blocks 97920 free
  255.       *** FILE SYSTEM WAS MODIFIED ***
  256.  
  257.  
  258.  
  259. The fsck program makes a five-phase pass on each disk to verify and fix the
  260. file system.  Therefore, the log should report a series of five-phase messages
  261. for each disk on the server.
  262.  
  263. To determine which files have been deleted by the fsck program, look for the
  264. FILE= entry in the "** Phase 2 - Check Pathnames" section.  In the example
  265. above, the files named /banyan/st/st and /BFS/fs1/TEST.1/ABC were two of the
  266. five files that were found to be inconsistent and were deleted.
  267.  
  268. Note that the "** Phase 4 - Check Reference Counts" section may contain a
  269. number of entires that are either redundant or unrelated to the file system
  270. inconsistency problem.  These message include UNREF FILE, BAD/DUP FILE
  271. I=nnnn, and FREE INODE COUNT WRONG IN SUPERBLK.  You can ignore
  272. these entries.
  273.  
  274. The types of deleted files and the recovery procedure that you should follow
  275. are as follows:
  276.  
  277.     ■ Files whose pathnames begin with "/banyan" are VINES internal files,
  278.       and in most cases are necessary for the system to operate properly.
  279.       To recover these files, you must perform an upgrade procedure.
  280.  
  281.     ■ Files whose pathnames begin with "/BFS/VINESFiles" are VINES FILES on
  282.       drive Z.  To recover these files, you can restore them from backup media
  283.       or choose "Reload VINES Files from Release Media" at the Backup/Restore
  284.       menu.  You can also recover them by upgrading the server.
  285.  
  286.     ■ Files whose pathnames begin with "/local" are Applications Toolkit files
  287.       or third-party files.  To recover these files, re-install the Toolkit or
  288.       the third-party application.
  289.  
  290.     ■ All other files should be user data files.  To recover these files,
  291.       restore them from copies on your PC (see step 1 in the previous section)
  292.       or from a previous backup.
  293.  
  294. Please note that the log file may contain these messages for any of the disks:
  295.  
  296.     ■ A message that contains the text: DUP TABLE OVERFLOW
  297.  
  298.     ■ A message that contains the text: ROOT INODE
  299.  
  300. If you see either of these messages, the affected disk may need to be
  301. reformatted.  In this case, contact your Banyan service representative for
  302. assistance.
  303.  
  304.  
  305.  
  306. POST-RECOVERY RECOMMENDATIONS:
  307.  
  308. The 4.10-CF-3 and 4.10-CG-3 patches, as well as the 4.10 (5) maintenance
  309. release, will prevent a reoccurrence of the file system inconsistency problem.
  310. After you apply the fix, it is recommended that you take these two actions:
  311.  
  312.     ■ The fsck program verifies only the consistency of a disk's file system
  313.       structure.  It does not verify the integrity of the data contained in
  314.       user files on that disk.  Therefore, if you have any data verification
  315.       programs, you should run them on your data files.
  316.  
  317.     ■ Permanently archive your final 4.00 backup and the 4.10 backup that
  318.       you took before applying the patch.
  319.  
  320. If you need assistance at any time, contact your service representative.
  321. Banyan will verify your findings and provide guidance in the recovery procedure.
  322.